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g (54) Title: C ORYNEBA CTERI UM GLUTAMICUM GENES ENCODING METABOLIC PATHWAY PROTEINS 

O ( 57) Abstract: k 01 **** nucleic acid molecules, designated MP nucleic acid molecules, which encode novel MP proteins from 
Corynebacterium glutamicum are described. The invention also provides antisense nucleic acid molecules, recombinant expression 
W vectors containing MP nucleic acid molecules, and host cells into which the expression vectors have been introduced. The invention 
^ still further provides isolated MP proteins, mutated MP proteins, fusion proteins, antigenic peptides and methods for the improve- 
^ mem of production of a desired compound from C. glutamicum based on genetic engineering of MP genes in this organism. 



LOCUS AX063913 1170 bp DNA linear PAT 24-JAN-2001 

DEFINITION Sequence 195 from Patent WO0100843. 

ACCESSION AX063913 . 

VERSION- " K.AX063913.1 GI : 12541625 . 

KEYWORDS 

SOURCE Corynebacterium glutamicum. 

ORGANISM .Corynebacterium glutamicum : . 

Bacteria; Firmicutes; Actinobacteria;. Actinobacteridae; 

Ac tlnomyce tales; Corynebacterineae; Corynebacteriaceae; 

Corynebacterium. . ■•• •* . 

REFERENCE 1 (bases 1 to 1170) 

.^AUTHORS . PompejuslM. , Kroeger^B., Schroedef , H.' ; Zelder,0. k and Haberhauer, G. 
: TITLE; 'corynebacterium glutamicum genes encoding metabolic : pathway . 
.proteins 
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'BASF AKTIENGESELLSCHAFT (DE) 

Query Match 99.9%; Score 1144.4; DB 6; Length 1170; 

Best Local, Similarity 99.9%; Pred. No.. 2.4e-311; r,. 1 . 

Matches , 1145; ^Conservative. 0; Mismatches 1; Indels 0; Gaps 0; 

ATGAATTTTTACCCACCATCTGTACCTATTAACCCTGCGTGGCGTCCACCCACAGTAACT 60 
I I i I I I I I I I I I I i I M I I I I I I I I I I I M I I I I I I I I I.I I I I I II M I I I I i l.i I I I I I 
ATGAATTTTTACCCACCATCTGTACCTATTAACCCTGCGTGGCGTCCACCCACAGTAACT 61 

GTGCAAGCGGGACGGCCAGCCAGAACTCCTGGTGCGCCGATGAACCCACCTATCACGTTG 120 
I M I I I I I I II I I I t I I I I I I I I I I I I I I i I I I I II I I i I I I I I I M I I I II I I I II I I I 
GTGCAAGCGGGACGGCCAGCCAGAACTCCTGGTGCGCCGATGAACCCACCTATCACGTTG 121 

TCCAGCACT^TATGTtCATGATTCAGAAAAAGCTTATGGGCGCGATGGCAATGATGGATGG 180 
M I I I I I I I I I I I I I I I I ! I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCAGCACTTATGTTCATGATTCAGAAAAAGCTTATGGGCGCGATGGCAATGATGGATGG, 181 

GGTGCATTTGAGGCTGCCATGGGAACTCTAGATGGTGGGTTCGCGGTATCTTATTCTTCA' : 240 
I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I i I I I I I II I I I I I II I I I I I I I 
GGTGCATTTGAGGCT'GCCATGGGAACTCTAGATGGTGGGTTCGCGGTATCTTATTCTTCA . . 241 

GGTTTGGCAGCGGCAACGTCGATTGCTGATTTGGTTCCTACTGGTGGCACAGTTGTTTTA -300 

Miii in i ii ii 1 1 1 1 1 1 1 ri i n ii 1 1 1 1 1 1 1 1 1 1 iii i ii ii 1 1 rm || I I I I I II 

GGTTTGGCAGCGGCAACGTCGATTGCTGA^TTTGGTTCCTACTGGTGGCACAGTTGTTTTA 3.01 

CCTAAAGCTGCCTATTATGGCGTGACCAATATTTTCGCCAGGATGGAAGCCCGCGGAAG.G 3 60 

I M MINIMI I II M II I II I I I I I I I I I I I I I I I I I I II I I II I MM I I II I I II I 
CCTAAAGCTGCCTATTATGGCGTGACCAATATTTTCGCCAGGATGGAAGCCCGCGGAAGG 361 

C T G AAGGT T C G AAC T G T T GAT G C AG AC AAT AC C G AAGAAGT G AT T GC T GC T GC T C AAGG T 420 

i ii ii i ii 1 1 ri 1 1 ii 1 1 1 1 1 1 m 1 1 ii i i.i 1 1 i u 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1; 

CTGAAGGTTCGAACTGTTGATGCAGACAATACCGAAGAAGTGATTGCTGCTGCTCAAGGT 421 

GCAGATGTGGTGTGGGTGGAATCGATCGCTAATCCGACGATGGTGGTAGCTGATATCCCT 4 80 

II I I I I I I I III I M II I I I I I I I I I I I I I I I I I I I I I I 1 I I I I M.I I I I I I I II I I I I I 
GCAGATGTGGTGTGGGTGGAATCGATCGCTAATCCGACGATGGTGC3TAGCTGATATCCCT 4 81 

GCAATAGf CGACGGTGTGCGTGGGCTTGGAGTTTTGACTGTCGTTGACGCGACTTTCGCA- 540 

III II I II I II II II I Mil II I I M II II I M I I II II I I I I I II I I M I II I M M I I 
GCAATAGTCGACGjSTGTGCGTGGGCTTGGAGTTTTGACTGTCGTTGACGCGACTTTCGCA 541 
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541 ACGCCACTTCGTCAACGTCCATTGGAACTTGGTGCTGATATTGTGCTTTACTCGGCAACC 600 
I I M M I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I || I I 

542 ACGCCACTTCGTCAACGTCCATTGGAACTTGGTGCTGATATTGTGCTTTACTCGGCAACC 601 

601 AAACTTATCGGTGGACACTCTGATCTTCTTCTTGGAGTCGCAGTGTGCAAGTCTGAGCAC 660 
I I I I I I I I I I II I I I I I I I I I II I I I I II I I II I I I I I I I I I I I I I II I I I I I | | | | I I I 

602 AAACTTATCGGTGGACACTCTGATCTTCTTCTTGGAGTCGCAGTGTGCAAGTCTGAGCAC 661 

661 CATGCGCAGT.TTCTTGCCAGTCACCGTCATGATCATGGTTCAGTGCCGGGAGGTCTTGAA 720 
I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | I I I I I I 

662 CATGCGCAGTTTCTTGCCACTCACCGTCATGATCATGGTTCAGTGCCGGGAGGTCTTGAA 721 

721 GCGTTTCTTGCTCTCCGTGGATTGTATTCCTTGGCGGTGCGTCTTGATCGAGCAGAATCC 780 
I I I I M I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I M | | | | | | | | | || | 

722 GCGTTTCTTGCTCTCCGTGGATTGTATTCCTTGGCGGTGCGTCTTGATCGAGCAGAATCC 781 

781 AACGCAGCAGT^ACTTTCGCGGCGACTTAACGCGCATCCTTCGGTTACCCGCGTCAATTAT 840 
I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

782 AACGCAGCAGAACTTTCGCGGCGACTTAACGCGCATCCTTCGGTTACCCGCGTCAATTAT 841 

c 

841 CCAGGACTTCCTGATGATCCCCAACATGAAAAAGCCGTGCGAGTCCTACCCTCTGGATGT 900 
I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

842 CCAGGACTTCCTGATGATCCCCAACATGAAAAAGCCGTGCGAGTCCTACCCTCTGGATGT 901 

901 GG AAAC ATG T T G T CAT T T GAG C T T G AT GC AAC AC C T G AAC G AAC T GAT GAG AT TC T C G AA 960 
I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 

902 GGAAACATGTTGTCATTTGAGCTTGATGCAACACCTGAACGAACTGATGAGATTCTCGAA 961 

9 61 AGCCTGTCACTTTTAACCCACGCGACCAGTTGGGGAGGTGTGGAAACAGCCATTGAACGT 1020 

M I II I I Ml III I I I I I I l-l I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
962 AGCCTGTCACTTTTAACCCACGCGACCAGTTGGGGAGGTGTGGAAACAGCCATTGAACGT 1021 

.1021 CGCACCAGGCGGGATGCTGAAGTGGTGGCAGGAGTACCGATGACTCTTTGCCGCGTTTCC 1080 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I h I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1022 CGCACCAGGCGGGATGCTGAAGTGGTGGCAGAAGTACCGATGACTCTTTGCCGCGTTTCC 1081 

1081 G TAG G AAT T G AAG AC G T T G AAG AT C TAT G GG AAG ACC T C AACG C C T C AAT CG AC AAAG T T 114 0 

1 1 1 n 1 1 1- 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1082 GTAGGAATTGAAGACGTTGAAGATCTATGGGAAGACCTCAACGCCTCAATCGACAAAGTT 1141 

1141 CTGGGT 1146 

II III r 

1142 CTGGGT 1147 
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-3 (1-382) x AX063913 (1-1170) 

MetAsnPheTyrProProSerValProIleAsnProAlaTrpArgProProThrValThr 20 

I I I I U I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I Mil I I I I I I I I I I I 1. 1 I I I I I I I • 
ATGAATTTTTACCCACCATCTGTACCTATTAACCCTGCGTGGCGT.CCACCCACAGTAACT 61 

ValGlnAlaGlyArgProAlaArgThrProGlyAlaProMetAsnProProIleThrLeu 40 

II I MM! I III! Ill I I M I I I I I I I I Ml Ml I Ml' M I I I II I I I II I hi i I I I I I I 
GTGCAAGCGGGACGGCCAGCCAGAACTCCTGGTGCGCCGATGAACCCACCTATCACGTTG 121 

SerSerThrTyrValHisAspSerGluLysAlaTyrGlyArgAspGlyAsnAspGlyTrp 60 
I I II I I II I Ml I I I I II II I I I I II I II I I I I I I I II I Mil. Ml I I I I I II M I M I I 
T CC AG C ACT TAT G T T CAT GAT T C AGAAAAAG C T T AT GGGC GCGAT G GC AAT GAT GGAT G G 181 

GlyAlaPheGluAlaAlaMetGlyThrLeuAspGlyGlyPheAlaValSerTyrSerSer 8 0 

I II II II I I I I I I I I I I I I I I I II I I II I II I I II I I I I III I MM I M I M M II I I I. 
GGTGCATTTGAGGCTGCCATGGGAACTCTAGATGGTGGGTTCGCGGTATCTTATTCTTCA 241 

GlyLeuAlaAlaAlaThrSerlleAlaAspLeuValProThrGlyGlyThrValValLeu 100 

II I I I M II II I I I I II I I I I I I I II I I I II I II II I I I II II II I I I II II I I I I I I I I 
GGTTTGGCAGCGGCAACGTCGATTGCTGATTTGGTTCCTACTGGTGGCACAGTTGTTTTA 301 

ProLysAlaAlaTyrTyrGlyValThrAsnllePheAlaArgMetGluAlaArgGlyArg 120 
I II II I II II I I II I I II I I I I I I I II I II II I I I I I I I II II II I II II I I II I II I I I 
CCTAAAGCTGCCTATTATGGCGTGACCAATATTTTCGCCAGGATGGAAGCCCGCGGAAGG 361 

LeuLysValArgThrValAspAlaAspAsnThrGluGluVallleAlaAlaAlaGlnGly 140 
I I I I I I II II I I I I I I II I I II I I I I I I I I I I I I I I II I I II I I I I II I I I II I I II I I I 
CTGAAGGTTCGAACTGTTGATGCAGACAATACCGAAGAAGTGATTGCTGCTGCTCAAGGT 421 



160 



I I I II II I I I I I I M I I I I I II I I I II I I II I I I II II I I I I I M II II I I I I I I I I I II 



Db 



422 GCAGATGTGGTGTGGGTGGAATCGATCGCTAATCCGACGATGGTGGTAGCTGATATCCCT 481 
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AlalleValAspGlyValArgGlyLeuGlyValLeuThrValValAspAlaThrPheAla 180 
I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I | | | | | | | | | | 
GCAATAGTCGACGGTGTGCGTGGGCTTGGAGTTTTGACTGTCGTTGACGCGACTTTCGCA 541 

ThrProLeuArgGlnArgProLeuGluLeuGlyAlaAspIleValLeuTyrSerAlaThr 200 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
ACGCCACTTCGTCAACGTCCATTGGAACTTGGTGCTGATATTGTGCTTTACTCGGCAACC 601 

LysLeuIleGlyGlyHisSerAspLeuLeuLeuGlyValAlaValCysLysSerGluHis 220 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I M I I I 
AAACTTATCGGTGGACACTCTGATCTTCTTCTTGGAGTCGCAGTGTGCAAGTCTGAGCAC 661 



I I I II I I M I I I I I I I I I I I I II I I I I I I II I I I I I I I I I || | | | | | | | | | | | | | | | | | | 
CATGCGCAGTTTCTTGCCACTCACCGTCATGATCATGGTTCAGTGCCGGGAGGTCTTGAA 721 

AlaPheLeuAlaLeuArgGlyLeuTyrSerLeuAlaValArgLeuAspArgAlaGluSer 260 
I I I M I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I II I I I I I I I I 
GCGTTTCTTGCTCTCCGTGGATTGTATTCCTTGGCGGTGCGTCTTGATCGAGCAGAATCC 781 



I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I M 
AACGCAGCAGAACTTTCGCGGCGACTTAACGCGCATCCTTCGGTTACCCGCGTCAATTAT 841 

ProGlyLeuProAspAspProGlnHisGluLysAlaValArgValLeuProSerGlyCys 300 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCAGGACTTCCTGATGATCCCCAACATGAAAAAGCCGTGCGAGTCCTACCCTCTGGATGT 901 



M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M | 
GGAAACATGTTGTCATTTGAGCTTGATGCAACACCTGAACGAACTGATGAGATTCTCGAA 961 



M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II 
AGCCTGTCACTTTTAACCCACGCGACCAGTTGGGGAGGTGTGGAAACAGCCATTGAACGT 1021 > 

a 

ArgThrArgArgAspAlaGluValValAlaGlyValProMetThrLeuCysArgValSer 360 O 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I o 
CGCACCAGGCGGGATGCTGAAGTGGTGGCAGAAGTACCGATGACTCTTTGCCGCGTTTCC 1081 

-J 

ValGlylleGluAspValGluAspLeuTrpGluAspLeuAsnAlaSerlleAspLysVal 380 03 
N I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I < 
GTAGGAATTGAAGACGTTGAAGATCTATGGGAAGACCTCAACGCCTCAATCGACAAAGTT 1141 — 

LeuGly 382 ^ 

II 1111 ^ 
CTGGGT 1147 H 

CO 
HI 
CO 



